實(shí)時(shí)語音識別 RASR
實(shí)時(shí)語音識別 RASR
實(shí)時(shí)語音識別(Real-time ASR),將連續(xù)的音頻流實(shí)時(shí)轉(zhuǎn)換(huàn)成文本,語音識別更快。可應(yīng)用於直播實(shí)時(shí)字幕、會(huì)議實(shí)時(shí)記錄、即時(shí)文本生成等場(chǎng)景。
實(shí)時(shí)語音識別(Real-time ASR),將連續(xù)的音頻流實(shí)時(shí)轉(zhuǎn)換(huàn)成文本,語音識別更快。可應(yīng)用於直播實(shí)時(shí)字幕、會(huì)議實(shí)時(shí)記錄、即時(shí)文本生成等場(chǎng)景。
功能特性
功能特性
文本時(shí)間戳
為音頻轉(zhuǎn)換(huàn)結(jié)果生成特定的時(shí)間戳,從而通過(guò)搜索文本即可快速找到對(duì)應(yīng)的原始音頻片段。
智能斷句
通過(guò)提取上下文相關(guān)語義特徵,並結(jié)合語音特徵,智能劃(huà)分斷句及添加標(biāo)點(diǎn)符號(hào),提升輸(shū)出文本的可閱讀性。
中英文混合識別
支持在中文句子識別中可夾帶英文字母、數(shù)字等,從而實(shí)現(xiàn)中、英文以及數(shù)字的混合識別。
語言支持
支持中文普通話(huà),含帶方言口音的普通話(huà)、方言(四川話(huà)、上海話(huà)、粵語)識別。
即時(shí)輸(shū)出識別結(jié)果
連續(xù)識別語音流內(nèi)容,即時(shí)輸(shū)出結(jié)果,並可根據(jù)上下文語言模型自動(dòng)校正。
自動(dòng)靜音檢測(cè)
對(duì)輸(shū)入語音流進(jìn)行靜音檢測(cè),識別效率和準(zhǔn)確率更高。